查看原文
其他

这就是你要的‘读心术’?

2017-11-03 Cohen EffieLiu 脑人言

点击上方“脑人言”可以订阅哦


作者:Cohen、EffieLiu

审稿:南瓜落落

编辑:X君



大家还记得去年占满各个封面的“大脑语义地图”吗?加州大学伯克利分校的Jack Gallant通过记录人类对语言刺激的反应绘制出了大脑的语义图谱。研究大概是这样的:他们请来7位受试躺在fMRI(功能性磁共振成像)中倾听The Moth Radio Hour的故事,在受试听故事的过程中记录下他们大脑血氧水平的变化情况及其模式;接着,他们将大脑皮层划分为几万个小区域,将故事文本的词汇意义与脑部活动数据进行对比,看相关词汇组如何在这些小区域引发神经反应;接下来,他们建立了计算模型,以此来分析皮层的每个小点所代表的语义信息类型。为了将复杂的语义模型视觉化(见图1),他们使用了主成分分析(principal components analysis,PCA)的方法,目的是找出数据中最重要的一些组分,同时这些组分还应尽可能多的保留住信息。利用这些较少且重要的组分,将皮层各个小区域所代表的语义信息类型视觉化,绘制出了复杂的语义地图。

图1 . 大脑语义地图。大脑不同区域如何表征 958 个常见英语词汇及其含义。这个工作会有意外的收获:通过观察大脑活动,就能知道你在想什么。


不过这次我们要介绍的是他的“解码读心技术”。Jack Gallant实验室目前正在尝试着进行“人脑解读”试验。在他们实验室的电脑屏幕上,左侧是在大脑扫描期间向受测者展示的一小段电影剪辑片段,右侧则是计算机程序根据扫描的大脑活动信息来预测的受测者正在观看的内容。剪辑片段中出现了正在与Kate Hudson进行对话的Anne Hathaway的脸,算法便自信地用大号的“woman”和“talk”来标注它们。当画面中显示的是野生动物纪录片的水下场景时,该程序“使尽浑身解数”来解码,最终试探性地给出小号的“whale”和“swim”。“这个是海牛,那个是什么还不知道”,Gallant说,他的程序以前遇到过大量的水生哺乳动物,但海牛还是头一次见。Gallant团队向躺在核磁共振仪中的参与者展示一系列图像和电影片段,根据参与者的大脑活动模式,来对程序进行训练。

图2. 根据大脑活动模式重构的视觉影像,YouTube上有很多相关的视频,[1] 国内可看的链接 http://www.le.com/ptv/vplay/24016644.html?ch=baidu_s


世界各地的团体正在使用这样的技术来尝试解码脑部扫描,并尝试破译人们所看、所听,以及他们记忆中甚至梦里的内容。媒体大幅地报道,认为这种技术带来了从“幻想到现实的读心能力,可能会影响我们所做的一切”。伦敦的经济学家推测科学家不久就能通过大脑扫描来实现心灵感应(telepathy),甚至让读者警惕这一能读出你脑中所想的技术。虽然公司开始追求脑解码技术的应用,如市场研究和谎言检测,科学家则对使用该技术来研究大脑本身更感兴趣。Gallant的小组和其他人正试图找出这些不同的大脑活动模式到底是如何产生的,并希望找出大脑用来理解周围的世界的算法与规则。他们希望这项技术能够透露给我们大脑进行组织调控的基本原理,以及它是如何编码记忆、行为和情感的。


Gallant认为视觉是大脑最有趣同时也是最简单的部分,而且还是他有可能在生前能够得到完美解决的领域,而对图片、视频等视觉刺激以外的活动用该技术解码则要求巨大的飞跃。这也是目前的研究大都集中于通过视觉刺激来寻求“读心术”的原因。

图3.通过大量特定图像激活的脑扫描数据来训练计算机程序。一旦建立了活动模式的数据库,它就可以对参与者先前不一定见过的图像进行测试,在测试期间,程序必须根据对类似活动模式的了解,来猜测所看到的对象。换句话说,就是用机器学习的方法分析fMRI数据,如果你问我具体是怎么分析的,我这个文科生只能呵呵了。


超越所谓的“亮点”生物学


大脑解读大约在十年前迅速发展,神经科学家意识到他们在使用功能磁共振成像(fMRI)仪进行研究时,产生了很多未加开发和利用的信息,该技术通过识别脑中正在补给含有氧和葡萄糖血液的区域,来测量大脑活动,这些区域在扫描中发出“亮点”。为了分析活动模式,大脑被分割成很多被称为体素(像素的三维等价物)的小框框,比如在看到一张脸时,研究人员通常会参考对脸部刺激反应最强烈的体素,同时丢弃体素中那些对刺激反应较弱的数据,从而得到脑中哪些领域正在处理面孔的信息。而解码技术会用到更多的脑扫描信息,包括强反应和弱反应脑区,而不仅是只参考对脸部反应最强烈的脑区,进而得到更细致的脑活动模式。早期的这类研究也证明了这一点:物体不只是由一个较小的、对刺激反应最活跃的区域编码,而是由更多的分布式区域来编码的。

 

这些收集到的数据被送到“模式分类器”,这是一种计算机算法,能够学习每幅图片、概念与它们对应的脑活动之间的模式。一旦程序测试了足够多的样本,它可以开始推断出某人正在看或想什么,这就不只是映射心理活动对应的脑中“亮点”。模式的不断优化不仅让研究人员得以回答类似于“哪个脑区产生了某某心理活动”这样简单的问题,更为探究心理活动的本质提供了可能。一个多年来一直存在争议的例子便是记忆的强度和分布问题[1] 。德克萨斯州奥斯汀分校的fMRI专家Russell Poldrack说,“解码技术使得研究人员可以检验那些关于脑如何执行操作任务的现有心理学理论”。

 

达特茅斯学院的Jim Haxby在2001年进行了第一次解码研究,他们从这些活动模式中成功区分了对象的类别,如剪刀,瓶子和鞋子等[1,2]。不久之后,另外两个团队分别独自使用此类解码技术来试图确认人脑组织的基本原则。研究将电极植入猴子和猫脑中的视觉区,这些区域对边缘的定向有强烈的反应,我们将这些区域称为“边缘偏好区域”(edge-loving region),边缘区域通常是光线强烈变化的地方。在人脑中,由于边缘偏好区域太小,用传统的功能磁共振成像技术难以观察,但通过将解码方法应用于fMRI数据,UCL的Dylan Haynes、日本的Yukiyasu Kamitani与Vanderbilt大学的Frank Tong,在2005年的研究表明了边缘能够引发特异的脑活动模式。研究人员向被试展示了各种方位的随意线条,通过不同的体素马赛克模式能够区分他正在看的方位[3,4]。

图4. Haxby在2001的解码实验对8类对象进行了成功区分,准确度达到96%。


2008年,边缘图片则换成更为复杂的图片,当时Gallant的团队开发了一个新的解码器,能够识别120张图片中被试者观看的是哪一张图片,这比推测一张图片属于哪一大类挑战更大。然后他们进一步开发了一个解码器,可以根据被试者的大脑活动,对被试者正在观看的电影产生一个原始版本的电影[5]。从2006年左右开始,研究人员一直在开发用于各种任务下的解码器:用于视觉图像,其中参与者想象一个场景;用于工作记忆中,参与者需要记住一个事实或数字;用于意图的预测,猜测被试者对两个数字进行加法还是减法运算的决定。“对意图的预测比解码视觉系统更难”,Haynes说,“有如此多的不同意图,我们该如何分类?图片可以按颜色或内容分组,但是怎么分类意图却不容易”。

 

Gallant的实验室初步证明了它的难度。通过第一人称战斗主题的视频游戏Counterstrike,研究人员尝试解读玩家向左、右移动、追逐敌人或开枪的意图。他们可能只是想要解释一个移动的意图,但是玩家在游戏中被射杀或杀死时,fMRI数据中的其他所有信息会被来自玩家的情绪信号所淹没,死亡的情绪信号主宰了一切,影响了对意图精确地推断。对梦的预测也是这样。Kamitani和他的团队今年早些时候在《Science》上发表了他们解梦的研究成果[6]。他们让参与者在扫描仪中睡觉,然后定期叫醒他们,要求他们回忆起他们在梦中看到的内容。该团队首先尝试重建梦中的实际视觉信息,但最终不得不面对词语分类的问题。他们的程序对人们梦中有哪些类别的对象,如汽车,文字,男人或女人等等,进行预测,达到了60%的精确度。Kamitani说,梦的主观性质使得进一步提取信息变得很难。“当我想到我的梦内容时,我感觉到我正在看东西,”他说,“但是梦可能不仅仅涉及大脑的视觉区,还涉及到那些更难建立可靠模型的区域”。

图5.怕你们太枯燥,配张图,Counterstrike就是以前网吧常玩的《反恐精英》。


反向工程的尝试


解码依赖于大脑活动与外部世界之间可以建立相关性的事实。例如,如果您想要做的就是使用大脑的信号来指挥一个机器手,那么简单地确定这些相关性就足够了。但是Gallant和其他人想要做的不仅仅是这些,他们想要追根溯源,找出大脑从最开始是如何组织和存储信息的,破解大脑使用的复杂代码。但这并非易事。每个大脑区域都会从其他网络获取信息,并将其组合起来,这可能会改变其表征信息的方式。神经科学家必须能够在事后推断出在哪个时刻做出了什么样的转变。与其他工程项目不同,大脑不是用对人脑和数学模型有意义的原理拼凑出来的。“我们不是设计大脑,大脑已经造好了,我们得弄清楚它是如何工作的”,Gallant说,“我们没有数学方法来对这些系统建模,即使收集了足够的数据,我们也很难有一套好的方程来描述它们的关系以及随着时间改变大脑又如何变化的过程”。

 

英国剑桥大学的计算神经科学家Nikolaus Kriegeskorte认为,尽管视觉系统是大脑中我们了解最多的部分,但试图彻底视觉信息的编码方式仍然很棘手。“视觉是人工智能的难题之一,我们认为相比于下棋或证明定理,视觉研究起来更容易”,他说,但仍有很多要探索:神经元集群如何表征一张脸,这些信息在视觉系统中的各区域间如何流动,以及表征脸部的神经编码当脸部变化时编码又如何改变。“从下到上地、从神经元到神经元地来构建一个模型太复杂了,没有足够的资源或时间这样做”,Kriegeskorte说。所以他的团队正在对现有的视觉模型与大脑数据进行比较,看看哪些模型与数据拟合地最好。


 真实世界的应用


解码技术通常是在单个大脑基础上建立起来的,但想要构造出一个能够跨越个体大脑,或即使是同一大脑的不同时间段的解码模型 47 32019 47 15289 0 0 3593 0 0:00:08 0:00:04 0:00:04 3594也是很复杂的问题。并且每个人的大脑都有点不一样,目前有几个团队正在努力构建这样一个适合所有人的模型。

 

许多有关脑解码技术的应用都需要考虑一个问题:对这些技术的应用会涉及到读取某人无意识的想法。虽然这些应用尚不理想,但公司们正在密切关注着。Haynes说他最近被来自戴姆勒汽车公司的代表问到,是否可以借此解读市场营销过程中消费者对物品的潜在偏好。他认为原则上可以,但目前的方法无法解决像是对于30种同类的不同产品认为哪个最好的问题。他说:“营销人员应该继续使用现有的营销手段,我很确定,使用传统的市场营销技术会更好。”许多为法律机构提供服务的公司也注意到了这项解码技术的用武之地。加州圣地亚哥的No Lie MRI正在使用与解码相关的技术,声称可以使用脑扫描来区分谎言和真相。斯坦福大学的法学家Hank Greely写道,法律制度用这些方法可更好地来检测谎言,检查记忆的可靠性,甚至揭露陪审员和法官的偏见。一些伦理学家认为,法律应该保护个人的内心思想和私人愿望,而牛津大学的神经病学家Julian Savulescu则认为,使用解码技术原则上并不存在任何问题。“人们对此有些担心,但如果以正确的方式使用它,能为我们节省很多时间和精力,脑数据与其他类型的证据没有什么不同”,他说,“我不明白为什么相比人们说出来的话,他们内心的想法就该被视为更高人一等的东西”。

 

Haynes最近在进行一项研究,让参与者参观几个虚拟现实的房屋,然后在他们选择参观其它房屋时扫描他们的大脑。初步结果表明,该团队可以确定参与者曾经去过哪些房屋。这意味着这样的技术可能会揭示嫌疑人是否曾经访问过犯罪现场,可还没等到研究结果公布,Haynes便迅速指出在执法中使用这种技术可能存在的局限性。“如果一个人曾去过该房子,但不记得了怎么办?或者说如果他们在犯罪发生前一天或之后去过该房子,那又该如何判断?嫌犯也可能骗过扫描仪,而我们却还不知道该如何采取反欺骗措施”。

 

通过解码能可靠地揭露人们隐藏的记忆的想法也遭到了其他科学家的反驳。“即使抛开所有意外和顾虑,你仍需要一个15吨、价值300万美元的功率磁共振成像仪,一个愿意躺在里面的人,并在脑中积极思考那些隐藏的想法”,Gallant说,“即便如此,信息在某人脑中出现过也并不意味着它是准确的”。当下,心理学家有更可靠、更便捷的方法来得到人们的想法,找出一个人想要做什么的最好办法,还是要问这个人他到底想要做什么。显然,“读心技术”还有很长的路要走,但回顾我们走过的路,还是感到惊奇,毕竟这在十几年前是难以想象的[1] 。

 

参考文献:

1.J. V. et al. Science 293, 2425–2430 (2001).

2.Cox, D. D. & Savoy, R. L. et al. NeuroImage 19, 261–270 (2003).

3. Haynes, J.-D. & Rees, G. Nature Neurosci. 8, 686–691 (2005).

4. Kamitani, Y. & Tong, F. Nature Neurosci. 8, 679–685 (2005).

5. Nishimoto, S. et al.Curr. Biol. 21, 1641–1646 (2011).

6. Horikawa, T., Tamaki, M., Miyawaki, Y. & Kamitani, Y. Science 340, 639–642(2013).


赞赏专用通道



新浪微博:脑人言

知乎专栏:行为与认知神经科学

QQ群:638710880

脑人言 | 聊聊脑科学


长按二维码关注我们


~友情赞助~





您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存